공분산 행렬이란?
- 다변량 가우스 분포의 퍼짐과 변수 간 관계를 모두 수학적으로 정리한 것을 의미.
- 각 변수들의 퍼짐(분산) + 서로의 관계(공분산) 를 담은 정리표 같은 것.
공분산 행렬의 형태
- 키와 몸무게 두 변수가 있을 때, 공분산 행렬은 아래처럼 생긴다.

- Var(키): 키의 분산 (키가 얼마나 퍼져 있는지)
- Var(몸무게): 몸무게의 분산
- Cov(키, 몸무게): 키와 몸무게가 함께 어떻게 변하는지 (공분산)
- 참고: 공분산은 대칭이라서 위/아래가 똑같아!

키 분산
-> 100: 키가 대략 ±10cm 정도 퍼져 있다는 뜻 (표준편차 10)
몸무게 분산
-> 64: 몸무게가 대략 ±8kg 정도 퍼져 있다는 뜻
키, 몸무게 공분산
-> 70: 키가 클수록 몸무게도 커지는 경향이 있다는 뜻 (양의 공분산)
(💡 양수 → 둘이 함께 증가 / 음수 → 한쪽이 커질 때 다른 쪽은 작아짐)
- 양의 공분산이면 그래프의 기울기가 오른쪽 위로 기울어지고, 음의 공분산은 왼쪽 위 방향으로 기울어진다.
📚 요약 정리
- 분산 : 각 변수 혼자 퍼진 정도
- 공분산 : 두 변수 간 "서로 커지거나 줄어드는 정도"
- 공분산 행렬 : 이 모든 정보를 정리한 표